Básicamente, creé una app que convierte audio en texto usando IA. Porque, seamos honestos, escribir manualmente es para gente con paciencia infinita 😅
¿Qué hace exactamente? (La versión sin tecnicismos)
Metes un audio (MP3, WAV, M4A, lo que sea), le das al botón de "Transcribir" y boom 💥 — la IA te lo convierte a texto. Así de simple. Es como tener un secretario que nunca se cansa, nunca se equivoca (bueno, casi nunca) y que además te genera subtítulos para CapCut.
Ideal si eres creador de contenido, podcaster, periodista o simplemente alguien que graba audios pero no quiere pasarse 3 horas escribiendo lo que dijo 😂
Lo que hace especial (mis features favoritas 🎯)
✨ Interfaz que no duele a la vista: Diseño oscuro con colores neón (cyan, verde, púrpura). Porque trabajar 8 horas mirando un fondo blanco es tortura medieval 😤
🧠 5 modelos de IA para elegir: Desde "Tiny" (rápido pero básico) hasta "Large" (lento pero preciso). Es como elegir entre una moto y un camión — depende si tienes prisa o precisión 🏍️🚚
🌍 Detecta idiomas automáticamente: Le metes un audio en chino, español, inglés... y adivina. Si falla, le dices manualmente y listo. Es como tener un traductor que a veces se equivoca pero que no se ofende 😅
📝 Genera prompts para ChatGPT: No solo transcribe, sino que te crea un prompt listo para meter en ChatGPT. Perfecto para cuando quieres que la IA te resuma un video de 1 hora en 5 minutos ⚡
🎬 Crea subtítulos SRT: Genera archivos de subtítulos listos para CapCut. Así tus videos quedan con subtítulos sin que tengas que hacer nada. Magia pura ✨
💾 Exporta todo lo que quieras: TXT, prompts, SRT... lo que necesites. Es como tener un cajón donde cabe todo.
Cómo funciona (la magia detrás del telón 🎭)
Está hecho en Python con Tkinter para la interfaz. Básicamente es un script que no te congela la pantalla mientras procesa (cosa que aprendí a la mala 😅). El flujo es así:
1️⃣ Seleccionar archivo: Haces clic en "Examinar" y buscas tu audio. Puede ser MP3, WAV, lo que sea. Si intentas meter un PDF, te lo rechaza 😂
2️⃣ Configurar: Eliges qué modelo quieres (¿rápido o preciso?), el idioma, y cuánto tiempo quieres que dure el resumen. Aquí es donde jugas a ser ingeniero 🔧
3️⃣ Procesar: Le das al botón "Transcribir" y la IA se pone a trabajar. Todo en un thread separado para que la interfaz no se quede congelada como un popsicle 🍦 Ves una barra de progreso bonita que te dice "tranquilo, estoy en ello"
4️⃣ Resultados: Boom 💥 — aparece el texto transcrito. Puedes copiar, generar un prompt para ChatGPT, o simplemente admirar tu obra maestra.
5️⃣ Guardar: Exportas como TXT, SRT o lo que necesites. Todo listo para usar en CapCut, Word, o donde sea. Misión cumplida 🎉
Con qué lo hice (el stack técnico 🛠️)
🐍 Python: El lenguaje que elegí porque es como el español de la programación — fácil de leer y muy versátil.
🎨 Tkinter: La librería para hacer la interfaz. Básicamente es lo que te permite ver botones bonitos en lugar de solo código en la terminal.
🤖 OpenAI Whisper: La IA que hace toda la magia. Es el cerebro del programa. Sin esto sería solo un botón que no hace nada 😅
⚙️ Threading: La cosa que hace que mientras procesa el audio, la interfaz no se quede congelada. Aprendí esto después de sufrir 😂
🎨 Colores neón personalizados: Porque la vida es demasiado corta para interfaces feas.
¿Para quién es esto? 👥
✅ Creadores de TikTok/YouTube: Graba un video, transcribe, genera subtítulos, sube. Boom. Contenido listo 🚀
✅ Periodistas/Reporteros: Entrevista a alguien, transcribe automáticamente, edita y publica. Adiós a escribir 3 horas 📰
✅ Estudiantes: Graba la clase, transcribe, estudia. Es como tener apuntes automáticos (y gratis) 📚
✅ Podcasters: Genera transcripciones para SEO, para que la gente te encuentre en Google. Más visitas = más dinero 💰
✅ Editores de video: Transcribe, genera subtítulos, importa a CapCut. Todo en 5 minutos. Eres un dios 🎬
